AI资讯新闻榜单内容搜索-ICLR

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: ICLR

西湖大学提出闭环扩散控制策略，高效与闭环兼得

西湖大学提出闭环扩散控制策略，高效与闭环兼得

西湖大学提出闭环扩散控制策略，高效与闭环兼得

高效闭环控制是复杂系统控制的核心要求。传统控制方法受限于效率与适用性挑战；而新兴的扩散模型虽然表现出色，却难以满足高效闭环控制的要求。西湖大学研究团队最新提出的 CL-DiffPhyCon 框架，通过异步并行去噪技术，在闭环控制要求下，显著提升了控制效率和效果。论文最近被人工智能领域顶级会议 ICLR 2025 接收。

来自主题: AI资讯

6041 点击 2025-02-28 09:48

ICLR 2025｜南洋理工大学AvatarGO，探索4D人与物体交互生成新方法

ICLR 2025｜南洋理工大学AvatarGO，探索4D人与物体交互生成新方法

ICLR 2025｜南洋理工大学AvatarGO，探索4D人与物体交互生成新方法

近年来，随着扩散模型和 Transformer 技术的快速发展，4D 人体 - 物体交互（HOI）的生成与驱动效果取得了显著进展。然而，当前主流方法仍依赖 SMPL [1] 这一人体先验模型来生成动作。

来自主题: AI技术研报

9467 点击 2025-02-23 16:39

剧本自动生成3D动画！北航中大等提出新方法，破解多人交互难题 | ICLR 2025

剧本自动生成3D动画！北航中大等提出新方法，破解多人交互难题 | ICLR 2025

剧本自动生成3D动画！北航中大等提出新方法，破解多人交互难题 | ICLR 2025

设定一个3D场景，你便可以用文字编织你的剧情。一句话，就能让两个人激烈争吵。来自北京航空航天大学、香港中文大学（深圳）、悉尼科技大学、中山大学等高校的研究者提出Sitcom-Crafter。成果已被ICLR 2025会议接收。

来自主题: AI技术研报

8952 点击 2025-02-21 08:57

小红书等给AI图像检测上难度！数据集均通过人类感知“图灵测试” | ICLR 2025

小红书等给AI图像检测上难度！数据集均通过人类感知“图灵测试” | ICLR 2025

小红书等给AI图像检测上难度！数据集均通过人类感知“图灵测试” | ICLR 2025

AI生成内容已深度渗透至生活的方方面面，从艺术创作到设计领域，再到信息传播与版权保护，其影响力无处不在。

来自主题: AI技术研报

9768 点击 2025-02-20 15:46

ICLR 2025 Spotlight | 让城市「动」起来！DynamicCity突破4D大场景生成技术边界

ICLR 2025 Spotlight | 让城市「动」起来！DynamicCity突破4D大场景生成技术边界

ICLR 2025 Spotlight | 让城市「动」起来！DynamicCity突破4D大场景生成技术边界

过去一年，3D 生成技术迎来爆发式增长。在大场景生成领域，涌现出一批 “静态大场景生成” 工作，如 SemCity [1]、PDD [2]、XCube [3] 等。这些研究推动了 AI 利用扩散模型的强大学习能力来解构和创造物理世界的趋势。

来自主题: AI技术研报

6236 点击 2025-02-19 14:23

首个基于统计学的线性注意力机制ToST，高分拿下ICLR Spotlight

首个基于统计学的线性注意力机制ToST，高分拿下ICLR Spotlight

首个基于统计学的线性注意力机制ToST，高分拿下ICLR Spotlight

Transformer 架构在过去几年中通过注意力机制在多个领域（如计算机视觉、自然语言处理和长序列任务）中取得了非凡的成就。然而，其核心组件「自注意力机制」的计算复杂度随输入 token 数量呈二次方增长，导致资源消耗巨大，难以扩展到更长的序列或更大的模型。

来自主题: AI技术研报

8746 点击 2025-02-19 10:02

ICLR 2025 Spotlight：音频生成新突破！港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight：音频生成新突破！港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight：音频生成新突破！港科北邮团队首次通过文本控制声源方向生成音频

兔子通过两只耳朵可以准确感知捕食者的一举一动，造就了不同品种广泛分布在世界各地的生命奇迹；同样人也需要通过双耳沉浸式享受电影视听盛宴、判断驾驶环境和感知周围活动状态。

来自主题: AI技术研报

8653 点击 2025-02-15 15:23

推理成本比MoE直降83%！字节最新大模型架构入围ICLR 2025

推理成本比MoE直降83%！字节最新大模型架构入围ICLR 2025

推理成本比MoE直降83%！字节最新大模型架构入围ICLR 2025

字节出了个全新架构，把推理成本给狠狠地打了下去！推理速度相比MoE架构提升2-6倍，推理成本最高可降低83%。

来自主题: AI技术研报

7339 点击 2025-02-12 11:37

ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA

ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA

ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA

新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队，专注于开源语音基础引擎研发，从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路，旨在提高智能语音任务的准确率和效率。

来自主题: AI技术研报

7351 点击 2025-02-07 16:02

ICLR 2025｜高效重建几何精准的大规模复杂三维场景，中科院提出CityGaussianV2

ICLR 2025｜高效重建几何精准的大规模复杂三维场景，中科院提出CityGaussianV2

ICLR 2025｜高效重建几何精准的大规模复杂三维场景，中科院提出CityGaussianV2

来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法 CityGaussianV2，能够在快速实现训练和压缩的同时，得到精准的几何结构与逼真的实时渲染体验。该论文已接受于 ICLR`2025，其代码也已同步开源。

来自主题: AI技术研报

7283 点击 2025-02-05 13:18

上一页当前第5页,共10页下一页